#ciencia computacional

Escalamiento de profundidad con expansión de capas cero/uno

Descubre cómo la expansión de capas cero/uno acelera el entrenamiento hasta 5x y ahorra un 80% de cómputo sin perder rendimiento.

2026-06-02 · 2 min

WUSH: Transformaciones Adaptativas Casi Óptimas para Cuantización de LLM

WUSH mejora la cuantización de LLMs hasta +2.8 puntos en W4A4. Transformaciones adaptativas casi óptimas para despliegue eficiente en GPU.

2026-06-02 · 1 min

Difusión compleja paralela para generación escalable de series temporales

Descubre PaCoDi: difusión espectral para series temporales escalables. Supera a métodos tradicionales en calidad y eficiencia.

2026-06-02 · 2 min

Flowers: un motor warp para solucionadores neuronales de PDE

Flowers: arquitectura neuronal con warps multihead. Sin Fourier ni atención, logra interacciones globales a costo lineal. Supera a modelos mucho más grandes.

2026-06-02 · 2 min

Optimización de Políticas con Mean Flow (MFPO)

Descubre cómo MFPO acelera el entrenamiento e inferencia en aprendizaje por refuerzo superando limitaciones de modelos de difusión.

2026-06-02 · 1 min

GUDA: Atribución grupal de datos de entrenamiento en modelos de difusión

GUDA: atribución grupal contrafactual eficiente para modelos de difusión. Usa desaprendizaje y es 100x más rápido que reentrenar con cada grupo eliminado.

2026-06-02 · 2 min

Descubrimiento científico evolucionable mediante minimización de incertidumbre

PiEvo revoluciona el descubrimiento científico al hacer evolucionar principios con IA. Logra un 31% más de calidad y un 83% de aceleración en la convergencia. Descúbrelo.

2026-06-02 · 2 min

Cuándo y cuánto imaginar: Escalado adaptativo con modelos del mundo para razonamiento espacial

Descubre cuándo y cuánto imaginar en razonamiento espacial visual. AVIC optimiza el uso de modelos del mundo, superando a GPT-4o con menos recursos.

2026-06-02 · 1 min

LASER: SVD consciente de pérdida y asignación de rango para modelos VL

Descubre cómo LASER logra una aceleración 2.3x en modelos visión-lenguaje con baja precisión, usando SVD consciente de pérdida y asignación de rango.

2026-06-02 · 2 min

Revisitando Procesos Neuronales con Fourier y Volterra

Descubre cómo la Transformada de Fourier y las Series de Volterra mejoran los Procesos Neuronales, logrando campos receptivos globales y escalabilidad lineal en datos irregulares.

2026-06-02 · 3 min

LookWise: Saber cuándo y dónde mirar en modelos multimodales

LookWise mejora el razonamiento visual detallado en modelos multimodales sin entrenamiento, logrando 4x más velocidad y mayor precisión en benchmarks. ¡Descúbrelo!

2026-06-02 · 2 min

U-Cast: Pronóstico meteorológico probabilístico simple y eficiente

U-Cast, modelo probabilístico, entrena en 12 días y genera ensamble en 3 segundos, superando a GenCast e IFS con 10x menos cómputo.

2026-06-02 · 2 min

¿Cuánta ortogonalización necesita Muon?

Descubre cuánta ortogonalización necesita el optimizador Muon para entrenar redes neuronales de forma eficiente sin sacrificar precisión.

2026-06-02 · 2 min

ProjQ: Compresión de LLM con Cuantización y Adaptadores

ProjQ revoluciona la compresión de LLMs al proyectar el ruido de cuantización en un subespacio de bajo rango. Obtén modelos más ligeros y eficientes con fine-tuning mejorado.

2026-06-02 · 2 min

Inferencia eficiente en tiempo de test para modelos de planificación generativa

Optimiza la inferencia en tiempo de prueba con el algoritmo OCL, mejorando eficiencia y calidad de soluciones en planificación generativa.

2026-06-02 · 2 min

Eventos raros, señales reales: conjuntos funcionales en redes espiga

Descubre cómo los conjuntos funcionales en redes neuronales espiga revelan patrones raros pero cruciales para el procesamiento de información en IA.

2026-06-02 · 2 min

DLLM-JEPA: Arquitectura JEPA para Modelos de Lenguaje con Difusión Enmascarada

DLLM-JEPA: nueva arquitectura que combina JEPA y difusión enmascarada para reducir FLOPs un 33% y ganar hasta 18.7% en precisión.

2026-06-02 · 2 min

ChurnNet: Una IA moderna optimizada para la predicción de abandono

¿Puede una IA optimizada como ChurnNet superar a los métodos clásicos de machine learning? Descubre los resultados en nuestra comparativa.

2026-06-02 · 2 min

Cuando datos escasean: escalando modelos dispersos con entrenamiento repetido

Optimiza el escalado de modelos dispersos con datos limitados. Descubre leyes de escalado, saturación retardada y compensaciones clave.

2026-06-02 · 1 min

Control de grupo adaptativo para RL síncrono on-policy más rápido

Descubre cómo el control de grupo adaptativo reduce los retrasos por rezagados en RL síncrono, acelerando el entrenamiento y mejorando el rendimiento en benchmarks.

2026-06-02 · 2 min